智能论文笔记

Cross-Lingual and Cross-Domain Crisis Classification for Low-Resource Scenarios

Cinthia Sánchez , Hernan Sarmiento , Jorge Pérez , Andres Abeliuk , Barbara Poblete

分类：自然语言处理

2022-09-05

社交媒体数据已成为有关现实世界危机事件的及时信息的有用来源。与将社交媒体用于灾难管理有关的主要任务之一是自动识别与危机相关的消息。关于该主题的大多数研究都集中在特定语言中特定类型事件的数据分析上。这限制了概括现有方法的可能性，因为模型不能直接应用于新类型的事件或其他语言。在这项工作中，我们研究了通过利用跨语言和跨域标记数据来自动对与危机事件相关的消息进行分类的任务。我们的目标是利用来自高资源语言的标记数据来对其他（低资源）语言和/或新（以前看不见的）类型的危机情况进行分类。在我们的研究中，我们从文献中合并了一个大型统一数据集，其中包含多个危机事件和语言。我们的经验发现表明，确实有可能利用英语危机事件的数据来对其他语言（例如西班牙语和意大利语）（80.0％的F1得分）对相同类型的事件进行分类。此外，我们在跨语言环境中为跨域任务（80.0％F1得分）取得了良好的性能。总体而言，我们的工作有助于改善数据稀缺问题，这对于多语言危机分类非常重要。特别是，当时间是本质的时候，可以减轻紧急事件中的冷启动情况。

translated by 谷歌翻译

Kernel Biclustering algorithm in Hilbert Spaces

Marcos Matabuena , J. C Vidal , Oscar Hernan Madrid Padilla , Dino Sejdinovic

分类： (统计)机器学习

2022-08-07

双簇算法分区数据并同时协变量，提供了几个领域的新见解，例如分析基因表达以发现新的生物学功能。本文使用能量距离（ED）和最大平均差异（MMD）的概念在抽象空间中开发了一种新的无模型双簇算法 - 能够处理复杂数据（例如曲线或图形）的概率分布之间的两个距离。所提出的方法比大多数现有文献方法都可以学习更多的通用和复杂的群集形状，这些方法通常着重于检测均值和方差差异。尽管我们的方法的两次簇配置受到限制，以在基准和协变量级别创建不相交结构，但结果是竞争性的。我们的结果与最佳场景中的最新方法相似，假设有适当的内核选择，当群集差异集中在高阶矩中时，它们的表现优于它们。该模型的性能已在涉及模拟和现实世界数据集的几种情况下进行了测试。最后，使用最佳运输理论的一些工具确定了新的理论一致性结果。

translated by 谷歌翻译

Variance estimation in graphs with the fused lasso

Oscar Hernan Madrid Padilla

分类：机器学习 | (统计)机器学习

2022-07-26

我们研究一般图形结构问题中方差估计的问题。首先，我们为均质的情况开发一个线性时间估计器，该估计器可以始终如一地估计一般图中的方差。我们表明，当平均信号与规范缩放的总变化时，我们的估计器可达到链和2D网格图的最小速率。此外，我们在瞬间条件下在一般图中的融合套索估计器的平均平方误差性能以及误差的尾巴行为上的束缚提供了一般的上限。这些上限使我们能够概括更广泛的分布类别，例如亚指数，在融合拉索上的许多现有结果，这些结果仅在以下假设是误差是次高斯随机变量的假设中。利用我们的上限，我们研究了一个简单的总变异正则估计器，用于估计异源性情况下的方差信号。我们的结果表明，方差估计器达到了估计网格图中有界变化的信号，$ k $ neart的邻居图具有非常温和的假设的最小值，并且对于估计任何连接图中的方差都是一致的。此外，广泛的数值结果表明，我们提出的估计量在各种图形结构模型中表现出色。

translated by 谷歌翻译

Real-time ground filtering algorithm of cloud points acquired using Terrestrial Laser Scanner (TLS)

Nelson Diaz , Omar Gallo , Jhon Caceres , Hernan Porras

分类：计算机视觉 | 机器人

2021-11-22

基于点云的3D建模需要从非接地物体分开地面的地面过滤算法。本研究提出了两个地面过滤算法。第一个基于正常载体。它有两个变体，具体取决于计算K-Collect邻居的过程。第二算法基于将云点转换为体素结构。为了评估它们，根据其执行时间，有效性和效率进行比较这两种算法。结果表明，基于体素结构的地面滤波算法在执行时间，有效性和效率方面比法线矢量接地滤波更快。

translated by 谷歌翻译

Feature Grouping and Sparse Principal Component Analysis with Truncated Regularization

Haiyan Jiang , Shanshan Qin , Oscar Hernan Madrid Padilla

分类： (统计)机器学习

2021-06-25

在本文中，我们考虑了一种用于主成分分析（PCA）的新变体，旨在同时捕获因子负载的分组和/或稀疏结构。为了实现这些目标，我们采用非凸截面的正则化，具有自然可调的稀疏性和分组效应，并提出了特征分组和稀疏主组件分析（FGSPCA）。所提出的FGSPCA方法鼓励具有相似值的因子负载，以将特征分组或特征零值组分成特征选择的差异均匀组，从而有助于降低模型的复杂性和增加模型解释。通常，现有的结构化PCA方法需要先验知识来构建正则化项。但是，提出的FGSPCA可以同时捕获因子负载的分组和/或稀疏结构，而无需任何事先信息。为了解决所得的非凸优化问题，我们提出了一种交替的算法，该算法结合了Convex编程，增强的Lagrange方法和坐标下降方法。实验结果证明了新方法在合成和现实世界数据集上的有希望的性能和效率。可以在github {https://github.com/higeeks/fgspca}上找到FGSPCA的R实现。

translated by 谷歌翻译

Robust Egocentric Photo-realistic Facial Expression Transfer for Virtual Reality

Amin Jourabloo , Baris Gecer , Fernando De la Torre , Jason Saragih , Shih-En Wei , Te-Li Wang , Stephen Lombardi , Danielle Belko , Autumn Trimble , Hernan Badino

分类：计算机视觉

2021-04-10

社会存在，与真实的人在一起的感觉，将推动由数字人类在虚拟现实（VR）中驱动的下一代通信系统。最佳的3D视频VR化身最小化不可思议的效果取决于特定于人的模型。但是，这些PS模型既耗时又耗时，并且通常受到数据可变性有限的训练，从而导致概括和稳健性差。影响面部表达转移算法准确性的主要变异性包括使用不同的VR耳机（例如，摄像头配置，耳机的斜率），面部外观随时间变化（例如，胡须，化妆）和环境因素（例如，，照明，背景）。这是VR中这些模型可扩展性的主要缺点。本文通过提出了通过专门的增强策略培训的端到端多个认同体系结构（MIA）来克服这些局限性的进展。 MIA使用最小的个性化信息（即中性的3D网格形状），从VR耳机中的三个相机（两只眼睛，一只嘴）从三个相机（两只眼睛，一只嘴）驱动了头像的形状。同样，如果可用PS纹理解码器，MIA能够在具有挑战性的情况下驱动完整的Avatar（Shape+Texture）强劲的PS模型。我们对改善鲁棒性和概括的关键贡献是，我们的方法以无监督的方式隐含地将面部表达与滋扰因素（例如耳机，环境，面部外观）脱离。我们在各种实验中证明了所提出的方法与最先进的PS方法的卓越性能和鲁棒性。

translated by 谷歌翻译

Extensions to the Proximal Distance Method of Constrained Optimization

Alfonso Landeros , Oscar Hernan Madrid Padilla , Hua Zhou , Kenneth Lange

分类：机器学习

2020-09-02

目前的论文研究了最小化损失$ f（\ boldsymbol {x}）$的问题，而在s $ \ boldsymbol {d} \ boldsymbol {x} \的约束，其中$ s $是一个关闭的集合，凸面或非，$ \ boldsymbol {d} $是熔化参数的矩阵。融合约束可以捕获平滑度，稀疏或更一般的约束模式。为了解决这个通用的问题，我们将Beltrami-Courant罚球方法与近距离原则相结合。后者是通过最小化惩罚目标的推动$ f（\ boldsymbol {x}）+ \ frac {\ rho} {2} \ text {dist}（\ boldsymbol {d} \ boldsymbol {x}，s）^ 2 $涉及大型调整常量$ \ rho $和$ \ boldsymbol {d} \ boldsymbol {x} $的平方欧几里德距离$ s $。通过最小化大多数代理函数$ f（\ boldsymbol {x}，从当前迭代$ \ boldsymbol {x} _n $构建相应的近距离算法的下一个迭代$ \ boldsymbol {x} _ {n + 1} $。）+ \ frac {\ rho} {2} \ | \ boldsymbol {d} \ boldsymbol {x} - \ mathcal {p} _ {s}（\ boldsymbol {d} \ boldsymbol {x} _n）\ | ^ 2 $。对于固定$ \ rho $和subanalytic损失$ f（\ boldsymbol {x}）$和子质约束设置$ s $，我们证明了汇聚点。在更强大的假设下，我们提供了收敛速率并展示线性本地收敛性。我们还构造了一个最陡的下降（SD）变型，以避免昂贵的线性系统解决。为了基准我们的算法，我们比较乘法器（ADMM）的交替方向方法。我们广泛的数值测试包括在度量投影，凸回归，凸聚类，总变化图像去噪和矩阵的投影到良好状态数的问题。这些实验表明了我们在高维问题上最陡的速度和可接受的准确性。

translated by 谷歌翻译